Three Similarity Measures between One-Dimensional Data Sets Tres medidas de similitud entre conjuntos de datos unidimensionales

نویسندگان

  • Luis Gonzalez-Abril
  • Jose M. Gavilan
  • Francisco Velasco Morente
چکیده

Basadas en una distancia intervalar, se dan tres funciones para cuantificar similaridades entre conjuntos de datos unidimensionales mediante el uso de estadísticos de primer orden. Se usa la base de datos Glass Identification para ilustrar cómo esas medidas de similaridad se pueden usar para analizar un conjunto de datos antes de su clasificación y/o para excluir dimensiones. Además, se diseña un test de hipótesis no parámetrico para mostrar cómo similaridad, basadas en muestras aleatorias de dos poblaciones, se pueden usar para decidir si esas poblaciones son idénticas. También se realizan dos análisis comparativos con un test paramétrico y un test no paramétrico. Este nuevo test se comporta razonablemente bien en comparación con test clásicos.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Semantic assessment of similarity between raster elevation datasets Valoración semántica de la similitud entre conjuntos de datos raster de elevación

This paper describes a method to assess the similarity between digital elevation models (DEM), based on the comparison of the landforms. The method attempts to mimic the one commonly used by human beings, which consists of comparisons among the shapes that a human subject identifies in the landscape. To do so, semantic similarity measurements are applied over a hierarchy of concepts. Our method...

متن کامل

Agregación de medidas de similitud para la detección de ortólogos: validación con medidas basadas en la teoría de conjuntos aproximados

This paper presents a novel algorithm for ortholog detection that involves the aggregation of similarity measures characterizing the relationship between gene pairs of two genomes. The measures are based on the alignment score, the length of the sequences, the membership in the conserved regions as well as on the protein physicochemical profile. The clustering step over the similarity bipartite...

متن کامل

Formation of Resemblance Measures Among Sets Formación de Medidas de Equivalencia entre Conjuntos

In this paper it is described a method to compute the distance between sets, that implies the formation of distance functions different from Hausdorff metric. Two functions with metric properties, which describe quantitatively distances between sets, are formed. First function can be used for sets arbitrary situated from each other. Second distance is more suited for sets clustered by rank link...

متن کامل

Un modelo para detectar la similitud semántica entre textos de diferentes longitudes

Resumen En el presente trabajo se desarrolla un modelo para resolver el problema de similitud semántica entre textos de diferente longitud. Se propone extraer caracteŕısticas léxicas, caracteŕısticas basadas en conocimiento y caracteŕısticas basadas en corpus, con el objetivo de desarrollar un modelo de aprendizaje supervisado. El modelo fue desarrollado utilizando regresión loǵıstica de la her...

متن کامل

Convergent validity of the measures of attention and impulsivity in the Trees: Simple Visual Discrimination Test (DiViSA-UAM)

Título: Validez convergente de las medidas de atención e impulsividad del Test de Discriminación Visual Simple de Árboles (DiViSA-UAM). Resumen: El Test de Discriminación Visual Simple de Árboles (DiViSA-UAM) constituye una prueba objetiva de evaluación de la atención y la impulsividad en niños de edades comprendidas entre los 6 y los 12 años. El presente estudio tuvo por objeto complementar lo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014